雑談 2025年6月
✂ from 💬雑談
2025/6/29
✂ to Gemma 3n使ってみたbsahd.icon
https://zenn.dev/sesere/articles/0420ecec9526dcClaude Codeの「すぐルール忘れる問題」を解決する超効果的な方法を見つけた気がする
Claude、実はコンテキストそこまで長くなかった?bsahd.icon
Alibabaが画像生成AI「Qwen VLo」を発表、プログレッシブ生成手法を採用しテレビの走査線みたいに上から順に描画される - GIGAZINE
2025/6/28
https://github.com/black-forest-labs/flux/commit/474dc4205306cb76c46ba510e35eec7bbed5efd1#diff-783da4f4a7e795319d557eb335a34372fc478b59525a0b6a53100332d09f0e1eR3-L45FLUX.1 (dev) Non-Commercial License v1.1.1
出力画像の商用利用はOKになったらしいnomadoor.icon
その代わり出力画像で他モデルのファインチューニングとかはするなよっていう文が増えた
普通にモデル名隠してWeb上に出したら区別せず学習に使われそうだが...bsahd.icon
なんにせよオープンソースコミュニティとしてはもうちょいライセンスゆるいモデルを育てるべきだと思うんだけどね…
2025/6/27
https://bfl.ai/legal/non-commercial-license-termsFLUX.1 (dev) Non-Commercial License v1.1
商用のライセンス買えっていうのはよくあるので全然良いのだけど、API使用料考えるとわざわざローカルモデル動かす意味がもの好き以外ほとんどないな…nomadoor.icon
LLM界隈だとセキュリティとか言われてるけど...bsahd.icon
みんなでOmniGen2育てようぜ!
Chroma(画像生成)モデルやHiDream-I1、txt2vid系のビデオモデルの1Frame出力(Wan2.1とか)の択も既にあるので(ここまで絞るなら)もうFlux自体を使う意味も旨みもあんま無いよね、感はある。morisoba65536.icon
FluxがSOTAで一強だった時代では既に無いのだ…
OpenAIの文字起こしAPIは音声データを2倍速か3倍速にすると安く使える - GIGAZINE
2025/06/26
https://github.com/google-gemini/gemini-cli/Gemini版Claude Code的なやつが出てきたmorisoba65536.icon
Gemini CLI
o4-miniが何回か検索して答えてくれるようになってるbsahd.icon
OmniGen2、モデルのサイズ小さいから仕方ないけどベースの性能がめちゃめちゃ悪いな…nomadoor.icon
Prompts by RAPHAEL#685d33ea00000000003ba266
2025/06/24
4o image generationの画像が/villagepumpに結構載ってるbsahd.icon
全体的に背景が黄ばんでて
ノイズが少しある画像が多いイメージ
検索したら結構同様の意見があった
https://www.reddit.com/r/ChatGPTPro/comments/1jls6cv/why_do_many_of_chatgptgenerated_images_look_like
https://www.reddit.com/r/OpenAI/comments/1juvem2/i_got_a_very_egregious_comparative_example_of_4o/
ghiblifyingの流行のせいかな
@kyutaro15: これあるあるですよね。GPTの画像生成で色温度の調整をされる方は、この数値を参考にすると良いと思います。
https://pbs.twimg.com/media/Go8CB_Ra0AANdiq.jpg
「色温度による見え方の違い」の背景が黄ばんでる時点で...bsahd.icon
あれ??sRGBなら6500Kの白が#fffになるのでは??
真っ白な画像作ってっていっても黄色いな…nomadoor.icon
https://gyazo.com/08307cc41050d3540235eab997c8d856
なんか、Stable Diffusionで極端な明暗を表現できない理由とその解決を思い出すけれど、茶色いノイズでも使ってるのかな
2025/6/22
https://github.com/kijaikijai🌴 On vacation
ゆっくり休んでください…nomadoor.icon
ComfyUI Orgに入ってしっかり給料もらって欲しいとも思うけど、どうか関わるかはひとそれぞれですからね…
2025/6/20
FLUX.1を始めとしたSOTA級画像生成モデルで度々言われる「プラスチックのような光沢のある肌」、ベンチマークの過適合もあるのだろうけど人気のある(アニメ顔にフォトリアルよりな体つきのNSFWありな)モデルがかなりの確率でこの系統なので案外普通に人間も「好き嫌いは別れやすいが需要は高い」奴なのでは⋯となるmorisoba65536.icon
2025/6/19
https://ascii.jp/elem/000/004/289/4289615/FramePack日本語圏がほんとにメインみたいね⋯morisoba65536.icon
5月くらいから割とredditの投稿に初心者的な質問が増えてる辺りだいたいどの国でも初任給でPC環境整える人割と多そうmorisoba65536.icon
そういうことなのか!nomadoor.icon
@kohya_tech: Wan2.1の1フレーム推論用ちびきゃらLoRAを学習してるけど、サンプル生成からまあまあ可能性を感じる。
https://pbs.twimg.com/media/GtxrYsxWkAAKsHK.jpg
Kohya先生がWan2.1の方まで1fハックを始めた模様です…nomadoor.icon
2025/6/18
https://github.com/tukisuwa/tksw_node/blob/main/doc/CustomCFGSchedule.mdCustom CFG Schedule for ComfyUIさんぷ
https://x.com/nana_tsukisuwa/status/1934755041279393809CFGを動的に変更できるノードらしい
今まで🦊SamplerCustomノードと🦊SplitSigmasノードでかなり頑張ってやってたのをスッキリ作れそう(ただこの組み合わせならScheduler自体もステップ単位で変更できる利点もあるが)morisoba65536.icon
https://www.reddit.com/r/StableDiffusion/comments/1ldm3ce/average_comfyui_user/?utm_source=share&utm_medium=mweb3x&utm_name=mweb3xcss&utm_term=1&utm_content=share_buttonワロタ(わたしもこれ)morisoba65536.icon
2025/6/17
https://lu.ma/zndawmg9ComfyUI Mini-Hackathon @ Github HQ (カリフォルニア州サンフランシスコ)
行ける人は行ってらっしゃい!!nomadoor.icon
2025/6/16
FramePack 1f生成なんも分からん、だれか教えて下さい(`;ω;´)nomadoor.icon
FramePackは逆に海外で微塵も流行ってないから流行らしてこようかな…
確かにreddit辺りでは出た当初に少し話題なったきりな感じはあるmorisoba65536.icon
2025/6/15
https://x.com/ComfyUIWiki/status/1934070603386134609ComfyUIネイティブでLora学習可能になった模様(Workflowなどは公式が作成中で来週くらいになりそうやしい)morisoba65536.icon
🚀nomadoor.icon
https://note.com/kawamou/n/nbe502e014e2fllmでSVGを書くmorisoba65536.icon
2025/6/14
o3-proの評判がないwogikaze.icon
o1-proほどの突飛感がなかったのかな
使ってる基素.icon
2025/6/5
https://www.reddit.com/r/StableDiffusion/comments/1l3aetp/release_lorasafe_torchcompile_node_for_comfyui/TorchCompileとloraの組み合わせバグが治った模様?morisoba65536.icon
@ComfyUI: 📢Subgraphs are coming!
-Turn complex workflows into reusable nodes
Edit once, update everywhere in the same workflow
Widgets, nesting and more!
✨ Beta drops next week
🥳Get ready to simplify your canvas.
🔗 More in detail: https://t.co/W2aFRQozYH
https://pbs.twimg.com/amplify_video_thumb/1930597369005129728/img/xHF4ay2Br_JELvYW.jpg
https://blog.comfy.org/p/subgraphs-are-coming-to-comfyuiSubgraphs Are Coming to ComfyUI! 🎉
サブグラフ欲しいと思ってたけど、いざ見ると余計初心者お断りworkflowが増えそうだな…nomadoor.icon
まあでもノードベースツールって本来そんなもんか
https://github.com/sdbds/musubi-tuner-scriptshttps://x.com/bdsqlsz/status/1928102269083602953Firaなるオプティマイザーで低メモリでllmや動画モデルを学習できるらしい?(数日前の投稿なので速報ならぬ遅報だけども)morisoba65536.icon
書き方からするとFramePack向けの.ps1スクリプトと同じようにwan2.1やHunyuanVideoのスクリプトも書いてやれば対応できそうな気配はある(フルチューンになるので少々取り回しは不便になるが)
2025/6/4
割とX日本語圏でのFramePack人気、国内でのX利用者比率の高さにくわえて「ハイエンドGPU以外」でも箱から出してすぐ使える(速度と品質のバランスの取れた)デフォルト設定が大きい気はしてきたmorisoba65536.icon
ComfyUI+Wan2.1でも今なら速度と品質のバランスを取りつつハイエンド以外で動かすこともできるが、速度を上げれる蒸留Lora(CausVid/AccVideo)が出たのが割と最近な上にTeaCacheなどは導入障壁が高い時期が長く続いてたからね…
今でも高速化手法をむやみに組み合わせると設定が喧嘩して出力壊れたりするので事前知識なしに手を出して使おうとすると試行錯誤する根気が求められる…
ついでに海外勢のComfyUI利用者でもComfyUI-WanVideoWrapper派とNativeノード派で情報が割れてるので自分の流派に読み替えたり時に組み合わせたりする必要がある。(海外勢でもNative版BlockwSapノードに触れてる例はほぼ見たことがない)
ComfyUI使うにしても結構クラウドで使ってる人が多いんですよねぇ…nomadoor.icon
思ったより12GB以上のVRAM持ってる人がいないイメージ
デザイナーとして使いたいならローカルじゃないとまどろっこしくない?と思ってパスして来たけれど、必要かな…
Kijaiさんへの信頼は凄いあるんだけど、オーバーワークになってる気がして(実際不眠症?気味なことredditで言ってた気がする)将来の安定性を見てネイティブをオススメしたい、けど一応書いとこうか
2025/6/1
6月ですnomadoor.icon
Reddit民との戯れが増えてきて英語版work4aiとまではいかなくても、英語のページ作っときたいなあと思ったり思わなかったり
システムの言語設定が日本語じゃなかったら右上の翻訳ボタンクソデカに出来たりしませんか…(;´Д`)
翻訳機能はそもそもProject Memberじゃないと使えないのか、知らなかった
まあ、chrome使ってるなら我々がRedditでブラウザの翻訳機能使ってるみたいに勝手に翻訳ボタン押すんじゃないの?(そのくらいはああいった掲示板の住人なら当然持ってるリテラシーと割り切ってもいい気もする)morisoba65536.icon
Cosenseのテキスト全部spanで囲まれてるせいで、自動翻訳とめちゃめちゃ相性が悪かった…ハズnomadoor.icon
悪いっすねwogikaze.icon
https://gyazo.com/1fa7cd63cd84e660895aa0f5d2733f8c
June's でIt wwwogikaze.icon
Today June 3rd 'sで it wwnomadoor.icon
https://chromewebstore.google.com/detail/没入型翻訳-webサイトとpdfを翻訳/bpoadfkcbjbfhfodiogcnhhhpibjhbnh?hl=ja&hl=ja はちゃんと翻訳してくれるなあ基素.icon
bsahd.iconつ/villagepump/scrapbox_reader